Prédiction de la polysémie pour un terme biomédical

نویسندگان

  • Juan Antonio Lossio Ventura
  • Clement Jonquet
  • Mathieu Roche
  • Maguelonne Teisseire
چکیده

Polysemy is the capacity for a term to have multiple meanings. Polysemy prediction is a first step for Word Sense Induction (WSI), which allows to find different meanings for a term, as well as for Information Extraction (IE) systems. In addition, the polysemy detection is important for building and enriching terminologies and ontologies. In this paper, we present a novel approach to detect if a biomedical term is polysemic or not, with the long term goal of enriching biomedical ontologies after disambiguation of candidate terms. This approach is based on meta-learning techniques, more precisely on meta-features. We propose the definition of novel meta-features, extracted directly from the text dataset, as well as from a graph of coccurrent terms. Our method obtains very good results, with an Accuracy and F-mesure of 0.978. MOTS-CLÉS : Polysémie, Induction de sens, Désambiguïsation, Méta-apprentissage, Métadescripteurs, Apprentissage automatique, Terminologie biomédical, Graphes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Vers l'intégration de la prédiction dans les cubes OLAP

L’analyse en ligne OLAP (On Line Analytical Processing) soutient les entrepôts de données dans le processus d’aide à la décision. Cependant, il n’existe pas d’outils pour guider l’utilisateur dans l’exploration, ni pour approfondir l’analyse vers l’explication et la prédiction. Dans un processus décisionnel, un utilisateur peut vouloir anticiper la réalisation d’évènements futurs. Le couplage d...

متن کامل

Représentation des données par un comité de cartes auto-organisatrices : une application aux données bruitées

Résumé. Grâce aux approches ensemblistes, les performances en apprentissage supervisé sont devenues excellentes sans pour autant être trop coûteuses en temps. Cependant, ces méthodes ne permettent que la prédiction des données. Or, le couplage entre la prédiction et une méthode de représentation ajoute une valeur qualitative. La représentation permet de redonner la main à l’utilisateur, que ce ...

متن کامل

Recherche de motifs spatio-temporels de cas atypiques pour le trafic routier urbain

Résumé. Un large panel de domaines d’application utilise des réseaux de capteurs géoréférencés pour mesurer divers évènements. Les séries temporelles fournies par ces réseaux peuvent être utilisées dans le but de dégager des connaissances sur les relations spatio-temporelles de l’activité mesurée. Dans cet article, nous proposons une méthode permettant d’abord de détecter des situations atypiqu...

متن کامل

Sélection par entropie de descripteurs textuels pour la catégorisation de documents XML

Dans le contexte de la catégorisation de documents, la sélection des descripteurs est une étape de pré-traitement importante qui permet non seulement de réduire la taille de l’index, mais aussi d’améliorer les performances des classifieurs. Parmi les approches utilisées pour construire un sous-ensemble de l’index, on peut distinguer d’une part, les méthodes de réduction de dimensions qui génère...

متن کامل

M ay 2 00 9 An example of a non adequate numeral system

Résumé Un système numérique est défini par la donnée de trois λ-termes clos: un λ-terme normal d0 pour Zéro, un λ-terme Sd pour le Successeur, et un λ-terme pour le Test à Zéro, tels que les λ-termes (Sd i d0) sont normalisables et possèdent des formes normales differentes. Un système numérique est dit adéquat ssi il possède un λ-terme clos pour le Prédécesseur. Dans cette Note nous présentons ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015